当前位置: 开发笔记 > 编程语言 > 正文

IJCAI2021|会议摘要有难度？快来引入对话篇章结构信息

作者：悠闲自在的鱼叫_688 | 来源：互联网 | 2023-09-02 22:28

点击下面卡片，关注我呀，每天给你送来AI技术干货！论文：DialogueDiscourse-AwareGraphModela

点击下面卡片&＃xff0c;关注我呀&＃xff0c;每天给你送来AI技术干货&＃xff01;

论文&＃xff1a;Dialogue Discourse-Aware Graph Model and Data Augmentation for Meeting

论文&＃xff1a;冯夏冲、冯骁骋、秦兵、耿昕伟

作者&＃xff1a;冯夏冲

链接&＃xff1a;https://arxiv.org/abs/2012.03502 (arXiv preprint)

代码&＃xff1a;https://github.com/xcfcode/DDAMS

出处&＃xff1a;哈工大SCIR

摘要

会议参与者的动态交互性和大规模训练数据的缺乏使得会议摘要成为一项具有挑战性的任务。现有的工作一方面将会议视为顺序句子序列进行建模&＃xff0c;忽略了句子之间丰富的交互结构&＃xff1b;另一方面&＃xff0c;训练数据的缺乏限制了摘要模型的性能。在本文中&＃xff0c;我们提出引入对话篇章结构来缓解上述问题。首先&＃xff0c;我们提出DDAMS会议摘要模型来显式地建模句子之间的交互关系&＃xff0c;其核心模块图编码器可以有效地以图交互的方式建模会议句子和多种篇章结构关系。除此以外&＃xff0c;我们还设计了一种可以从现有会议摘要数据集中构建伪摘要数据集的DDADA数据增强策略。通过DDADA构建的伪摘要数据集是原数据集大小的20倍&＃xff0c;可以有效地用于预训练DDAMS会议摘要模型。实验结果显示我们的方法可以在AMI和ICSI两个会议摘要数据集上取得SOTA效果。

1. 简介

1.1 研究背景

会议摘要&＃xff08;Meeting Summarization&＃xff09;旨在从一段多人会议中提取关键信息&＃xff0c;形成一段文字概述。由于新冠肺炎疫情的影响&＃xff0c;人与人之间的交流频繁地采用在线会议形式&＃xff0c;会议摘要可以有效地的帮助用户快速回顾会议内容&＃xff0c;整理诸如任务、决策、问题等核心内容&＃xff0c;是一项极具实用价值的任务&＃xff0c;得到了Microsoft等公司的关注[1][2]。

1.2 研究动机

现有会议摘要工作存在以下两个问题&＃xff1a;

1. 会议文本建模不充分。 由于会议参与者的动态交互性&＃xff0c;会议句子之间天然地存在着丰富的交互结构&＃xff0c;然而现有工作仅仅将会议句子视为顺序句子序列&＃xff0c;忽略了这种丰富的交互结构&＃xff0c;使得会议文本建模不够充分。

2. 大规模训练数据集缺乏。 基于神经网络的方法很大程度上依赖于训练数据的规模&＃xff0c;然而&＃xff0c;现有会议摘要数据集AMI和ICSI规模只有CNNDM数据集的千分之一&＃xff0c;极大地限制了摘要模型的性能。

为了缓解上述两个问题&＃xff0c;我们提出引入一种对话特定的结构信息&＃xff1a;对话篇章结构&＃xff0c;该结构指示了两个句子之间的语义关系&＃xff0c;如图1所示

现有对话篇章结构一共包含16种关系类型&＃xff1a;comment, clarification-question, elaboration, acknowledgment, continuation, explanation, conditional, QA, alternation, question-elaboration, result, background, narration, correction, parallel, contrast。

图1 对话篇章结构

对话篇章结构显式地指示了句子之间的交互关系和会议的信息流。引入该结构可以帮助模型更好地理解会议内容&＃xff0c;从而生成更好的会议摘要&＃xff0c;如图2所示。为了更好地建模会议文本与对话篇章结构信息&＃xff0c;我们提出了会议摘要模型DDAMS。

图2 会议-摘要对示例

进一步&＃xff0c;我们发现&＃xff0c;在一段会议中&＃xff0c;一个“问题”往往会引发一段“讨论”&＃xff0c;这段“讨论”往往围绕“问题”展开。如图2所示&＃xff0c;问题句包含了关键词语“battery charger”&＃xff0c;讨论中的“design”和“cost”均围绕该词语展开。因此我们认为“问题”包含了关键的词语和信息&＃xff0c;可以被视为“讨论”的“伪摘要”。基于该假设&＃xff0c;我们设计了一种数据增强策略DDADA&＃xff0c;从原始数据集中构建伪摘要数据集用于预训练会议摘要模型DDAMS。

1.3 任务定义

给定会议

&＃xff0c;会议摘要旨在生成摘要

&＃xff0c;其中会议

包括了

个句子

&＃xff0c;摘要

包括了

个词语

。第

个句子为

&＃xff0c;

代表第

个句子的第

个词语。每一个句子

都对应一个说话人

&＃xff0c;

是说话人集合。

2. Dialogue Discourse-Aware Meeting Summarizer (DDAMS)

2.1 整体框架

我们的摘要模型DDAMS包括了四个部分&＃xff1a;&＃xff08;1&＃xff09;会议图构建&＃xff1b;&＃xff08;2&＃xff09;节点表示&＃xff1b;&＃xff08;3&＃xff09;图编码器&＃xff1b;&＃xff08;4&＃xff09;解码器。整体如图3所示。

图3 摘要模型DDAMS

2.2 会议图构建

会议图&＃xff08;Meeting Graph&＃xff09;构建包括以下几个步骤&＃xff1a;

使用对话篇章结构解析器获得对话篇章结构关系&＃xff1b;
Levi图转换&＃xff0c;将边关系转换为节点&＃xff0c;并添加正向与反向边&＃xff1b;
添加全局节点、全局边和自连接边&＃xff1b;
添加反向边&＃xff08;Reverse Edges&＃xff09;。

图4 会议图构建流程

2.3 节点表示

关系节点&＃xff1a;从一个可学习的关系编码矩阵中初始化。
全局节点&＃xff1a;初始化为0向量。
句子节点&＃xff1a;利用双向LSTM进行初始化。

2.4 图编码器

在得到每一个节点的初始表示

之后&＃xff0c;我们使用Relational Graph Convolutional Networks [3] 更新节点表示&＃xff0c;该网络可以充分考虑不同类型的边&＃xff0c;从而学习到更加有效的表示&＃xff1a;

由于不同的对话篇章结构关系有着不同程度的重要性&＃xff0c;因此我们引入门控机制 [4] 来控制信息&＃xff1a;

最终得到引入门控机制的图网络更新方式为&＃xff1a;

2.5 解码器

解码器我们采用引入copy机制的解码器&＃xff0c;并同时考虑词语级别注意力机制和句子级别的注意力机制。

3. Dialogue Discourse-Aware Data Augmentation (DDADA)

3.1 伪摘要数据集构建

图5 伪摘要数据集构造示例

给定一段会议文本及其对话篇章结构&＃xff0c;我们发现一个“问题”往往引发一段针对这个问题的“讨论”。如图5所示&＃xff0c;A提问“What’s the standard colour?”&＃xff0c;其他人开始围绕颜色这个主题进行讨论。我们认为“问题”一定程度可以包含关键的信息和短语&＃xff0c;因此本文将“问题”视为伪造的摘要&＃xff0c;“讨论”视为伪造的会议&＃xff0c;从原始训练数据集中构建伪摘要数据集&＃xff0c;数据统计如表1所示。

表1 伪摘要数据集统计

3.2 预训练会议摘要模型

在得到伪摘要数据集之后&＃xff0c;我们使用该数据集预训练我们的会议摘要模型DDAMS。一方面&＃xff0c;通过我们的数据增强方法DDADA&＃xff0c;我们可以隐式地增广数据&＃xff1b;另一方面&＃xff0c;我们从原始训练集中进行增广&＃xff0c;可以保证增广数据和训练数据领域一致&＃xff0c;因此可以给模型提供一个热启动参数。

4. 实验

4.1 数据集

AMI&＃xff1a;产品设计领域会议摘要数据集&＃xff0c;数据集划分Train/Valid/Test: 97/20/20
ICSI&＃xff1a;学术讨论领域会议摘要数据集&＃xff0c;数据集划分Train/Valid/Test: 53/25/6

数据集统计如表2。

表2 AMI和ICSI数据集统计

4.2 主实验

表3 主实验结果

表3为主实验结果&＃xff1a;

引入对话篇章结构&＃xff0c;我们的模型DDAMS可以有效地超过诸多基线模型。
结合数据增强方法DDADA&＃xff0c;我们的模型可以取得世界最优的效果。
直接使用伪摘要数据预训练好的模型在测试集上进行测试&＃xff0c;也可以取得一定的效果&＃xff0c;说明了我们伪摘要数据集构建的合理性。

4.3 分析实验

图6 在测试阶段&＃xff0c;引入对话篇章结构关系的数量与平均ROUGE值的对应关系

在测试阶段&＃xff0c;我们按照一定的比例随机提供对话篇章结构关系。如图6所示&＃xff0c;引入的对话篇章结构信息越多&＃xff0c;模型的ROUGE得分越高&＃xff0c;显示了引入对话篇章结构的有效性。

图7 在测试阶段&＃xff0c;对话篇章结构关系的质量与平均ROUGE值的对应关系

在测试阶段&＃xff0c;我们引入不同质量的对话篇章解析器得到的对话篇章结构信息。如图7所示&＃xff0c;对话篇章解析器的质量越好&＃xff0c;对话篇章结构关系质量越高&＃xff0c;模型的的ROUGE得分越高。

图8 在测试阶段&＃xff0c;提供不同类型的对话篇章结构关系与平均ROUGE值的对应关系

在测试阶段&＃xff0c;我们单独提供一种特定类型的对话篇章结构关系。如图8所示&＃xff0c;在AMI数据集上&＃xff0c;Conditional 和Background两类关系比较重要。在ICSI数据集上&＃xff0c;Result关系比较重要。

表4 基于会议图&＃xff08;Meeting Graph&＃xff09;和Levi图的实验结果

基于我们构建的会议图和Levi图分别进行实验&＃xff08;区别在于Levi图没有反向边&＃xff09;&＃xff0c;我们发现我们的会议图可以取得更好的效果。

4.4 样例分析

图9 生成样例

图9展示了我们模型生成的会议摘要&＃xff0c;可以发现&＃xff0c;通过引入对话篇章结构关系&＃xff0c;句子1和句子3成为中心句&＃xff0c;从而定位了更加关键的内容&＃xff0c;最终生成与标准摘要更加相近的摘要。

5. 结论

在这篇文章中&＃xff0c;我们的贡献如下&＃xff1a;

我们首次将对话篇章结构应用于会议摘要任务&＃xff0c;并设计了一种会议摘要模型DDAMS有效地建模句子之间的交互关系。
我们设计了一种数据增强策略DDADA可以成功缓解训练数据不充足的问题。
我们的方法DDAMS&＃43;DDADA在两个会议摘要数据集上取得了世界最优的效果。

参考文献

[1] Zhu C, Xu R, Zeng M, et al. A Hierarchical Network for Abstractive Meeting Summarization with Cross-Domain Pretraining. Findings of EMNLP 2020.

[2] Zhong M, Yin D, Yu T, et al. QMSum: A New Benchmark for Query-based Multi-domain Meeting Summarization. arXiv preprint arXiv:2104.05938, 2021.

[3] Schlichtkrull M, Kipf T N, Bloem P, et al. Modeling relational data with graph convolutional networks. European semantic web conference 2018.

[4] Marcheggiani D, Titov I. Encoding Sentences with Graph Convolutional Networks for Semantic Role Labeling. EMNLP 2017.

本期责任编辑&＃xff1a;刘　铭

本期编辑&＃xff1a;彭　湃

说个正事哈

由于微信平台算法改版&＃xff0c;公号内容将不再以时间排序展示&＃xff0c;如果大家想第一时间看到我们的推送&＃xff0c;强烈建议星标我们和给我们多点点【在看】。星标具体步骤为&＃xff1a;

&＃xff08;1&＃xff09;点击页面最上方“深度学习自然语言处理”&＃xff0c;进入公众号主页。

&＃xff08;2&＃xff09;点击右上角的小点点&＃xff0c;在弹出页面点击“设为星标”&＃xff0c;就可以啦。

感谢支持&＃xff0c;比心。

投稿或交流学习&＃xff0c;备注&＃xff1a;昵称-学校&＃xff08;公司&＃xff09;-方向&＃xff0c;进入DL&NLP交流群。

方向有很多&＃xff1a;机器学习、深度学习&＃xff0c;python&＃xff0c;情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

点击上面卡片&＃xff0c;关注我呀&＃xff0c;每天推送AI技术干货~

整理不易&＃xff0c;还望给个在看&＃xff01;

推荐阅读

sum
poj 3352 Road Construction

poj 3352 Road Construction ... [详细]

蜡笔小新 2024-11-12 11:24:39
sum
面试中如何回答“零拷贝”技术问题？

零拷贝技术是提高I/O性能的重要手段，常用于Java NIO、Netty、Kafka等框架中。本文将详细解析零拷贝技术的原理及其应用。 ... [详细]

蜡笔小新 2024-11-13 02:03:52
split
Python 序列图分割与可视化编程入门教程

本文介绍了如何使用 Python 进行序列图的快速分割与可视化。通过一个实际案例，详细展示了从需求分析到代码实现的全过程。具体包括如何读取序列图数据、应用分割算法以及利用可视化库生成直观的图表，帮助非编程背景的用户也能轻松上手。 ... [详细]

蜡笔小新 2024-11-11 07:14:26
grid
Leetcode学习成长记：天池leetcode基础训练营Task01数组

前言这是本人第一次参加由Datawhale举办的组队学习活动，这个活动每月一次，之前也一直关注，但未亲身参与过，这次看到活动 ... [详细]

蜡笔小新 2024-11-14 18:01:31
sum
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
sum
基于iSCSI的SQL Server 2012群集测试(一)SQL群集安装

一、测试需求介绍与准备公司计划服务器迁移过程计划同时上线SQLServer2012，引入SQLServer2012群集提高高可用性，需要对SQLServ ... [详细]

蜡笔小新 2024-11-13 15:49:49
bash
CentOS 7 中配置开机自动挂载 NFS 的解决方案

本文详细介绍了在 CentOS 7 系统中配置 fstab 文件以实现开机自动挂载 NFS 共享目录的方法，并解决了常见的配置失败问题。 ... [详细]

蜡笔小新 2024-11-13 12:05:24
sum
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
sum
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
sum
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
sum
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
sum
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27
sum
微分方程相关笔记

Basic微分方程Whatis形如\(F(x,y,y',,y^{(n)})0\)求\(yf(x,y)\)阶：方程中导数的最高阶数解：yy(x)通解：\(yy(x,C ... [详细]

蜡笔小新 2024-11-12 00:47:38
sum
使用Jsoup解析并遍历HTML文档结构

使用Jsoup解析并遍历HTML文档时，该库能够高效地生成一个清晰、规范的解析树，即使源HTML文档存在格式问题。Jsoup具备强大的容错能力，能够处理多种异常情况，如未闭合的标签等，确保解析结果的准确性和完整性。 ... [详细]

蜡笔小新 2024-11-11 21:30:03
sum
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39

悠闲自在的鱼叫_688

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章